RESULT 1 
Y93 8_MYCTU 

ID Y93 8_MYCTU Reviewed; 759 AA. 

AC P71571; 005865; 

DT 01-NOV-1997, integrated into UniProtKB/Swiss-Prot . 

DT 30-MAY-2000, sequence version 2. 

DT 24-NOV-2009, entry version 67. 

DE RecName: Full=Putative DNA ligase-like protein Rv0938/MT0965; 

GN OrderedLocusNames=Rv0938, MT0965; ORFNames=MTCY0 8D9 . 01c, MTCY10D7 . 36c; 

OS Mycobacterium tuberculosis. 

OC Bacteria; Actinobacteria; Actinobacteridae ; Actinomycetales ; 

OC Corynebacterineae; Mycobacteriaceae ; Mycobacterium; 

OC Mycobacterium tuberculosis complex. 

OX NCBI_TaxID=1773; 

RN [1] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RC STRAIN=ATCC 25618 / H37Rv; 

RX MEDLINE=98295987; PubMed=9634230; DOI=10.1038/31159; 

RA Cole S.T., Brosch R., Parkhill J., Gamier T., Churcher CM., 

RA Harris D.E., Gordon S.V., Eiglmeier K., Gas S., Barry C.E. Ill, 

RA Tekaia F . , Badcock K., Basham D., Brown D., Chillingworth T., 

RA Connor R., Davies R.M., Devlin K., Feltwell T., Gentles S., Hamlin N . , 

RA Holroyd S., Hornsby T . , Jagels K., Krogh A., McLean J., Moule S., 

RA Murphy L.D., Oliver S., Osborne J., Quail M.A., Rajandream M.A., 

RA Rogers J., Rutter S., Seeger K., Skelton S., Squares S., Squares R., 

RA Sulston J.E., Taylor K., Whitehead S., Barrell B . G . ; 

RT "Deciphering the biology of Mycobacterium tuberculosis from the 

RT complete genome sequence."; 

RL Nature 393:537-544(1998) . 

RN [2] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RC STRAIN=CDC 1551 / Oshkosh; 

RX MEDLINE=22206494; PubMed=l 2 2 1 8 0 3 6 ; 

RX D0I=1 0.1 12 8/ JB. 18 4. 19. 5479-5490. 2002; 

RA Fleischmann R.D., Alland D., Eisen J. A., Carpenter L., White 0., 

RA Peterson J.D., DeBoy R.T., Dodson R.J., Gwinn M.L., Haft D.H., 

RA Hickey E.K., Kolonay J.F., Nelson W.C., Umayam L.A., Ermolaeva M.D., 

RA Salzberg S.L., Delcher A., Utterback T.R., Weidman J.F., Khouri H.M., 

RA Gill J., Mikula A., Bishai W., Jacobs W.R. Jr., Venter J.C., 

RA Fraser C .M. ; 

RT "Whole-genome comparison of Mycobacterium tuberculosis clinical and 

RT laboratory strains."; 

RL J. Bacteriol. 184:5479-5490(2002). 

CC -!- SIMILARITY: Belongs to the ATP-dependent DNA ligase family. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attr ibution-NoDerivs License 

CC 

DR EMBL; BX842575; CAB08492.1; -; Genomic_DNA. 

DR EMBL; AE000516; AAK45212.1; -; Genomic_DNA. 

DR PIR; B70585; B70585. 

DR RefSeq; NP_215453.1; -. 

DR RefSeq; NP_335398.1; -. 

DR PDB; 1VS0; X-ray; 2.40 A; A/B=452-759. 

DR PDB; 2IRU; X-ray; 1.65 A; A/B=l-300. 

DR PDB; 2IRX; X-ray; 1.8 0 A; A=l-300. 

DR PDB; 2IRY; X-ray; 1.7 8 A; A/B=l-300. 



PDB; 2R9L; X-ray; 2.40 A; A/B=l-300. 

PDBsum; 1VS0; -. 

PDBsum; 2IRU; -. 

PDBsum; 2IRX; -. 

PDBsum; 2IRY; -. 

PDBsum; 2R9L; -. 

GenelD; 885561; -. 

GenelD; 926354; -. 

GenomeReviews; AE000516_GR; MT0965. 
GenomeReviews; AL123456_GR; Rv0938. 
KEGG; mtc:MT0965; -. 
KEGG; mtu:Rv0938; -. 
TIGR; MT0965; -. 
TubercuList; Rv0938; -. 
HOGENOM; P71571; -. 
OMA; VDWSQNN; -. 

GO; GO: 0005524; F : ATP binding; IEA : UniProtKB-KW . 

GO; GO: 0003910; F : DNA ligase (ATP) activity; IEA: InterPro . 

GO; GO:0003896; F:DNA priraase activity; IEA: InterPro . 

GO; GO:0006310; P: DNA recombination; IEA: InterPro . 

GO; GO: 0006281; P : DNA repair; IEA: InterPro . 

GO; GO: 0006269; P : DNA replication, synthesis of RNA primer; IEA: InterPro . 

InterPro; IPR012309; DNA_ligase_A_C . 

InterPro; IPR012310; DN A_l i g a s e_A_M . 

InterPro; IPR002755; DNA_primase_S . 

InterPro; IPR014144; LigD_PE_domain . 

InterPro; IPR014145; LigD_pol. 

InterPro; IPR0123 40; NA-bd_OB-f old . 

InterPro; IPR014146; NHEJ_ligase_lig . 

Gene3D; G3DSA: 2 . 40 . 50 . 140; OB_NA_bd_sub; 1. 

Pfam; PF0 46 79; DNA_ligase_A_C; 1. 

Pfam; PF01068; DN A_l i g a s e_A_M ; 1. 

Pfam; PF01896; DNA_primase_S ; 1. 

TIGRFAMs; TIGR02777; LigD_PE_dom; 1. 

TIGRFAMs; TIGR02778; ligD_pol; 1. 

TIGRFAMs; TIGR02779; NHEJ_ligase_lig; 1. 

PROSITE; PS50160; DNA_L I GAS E_A3 ; 1. 

1: Evidence at protein level; 

3D-structure; ATP-binding; Complete proteome; Ligase; 
Nucleotide-binding . 
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Putative DNA ligase-like protein 
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STRAND 


629 


650 


FT 
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759 AA; 


83; 



81BD49222EE09E36 CRC64; 



Query Match 100.0%; Score 3993; DB 1; Length 759; 

Best Local Similarity 100.0%; 

Matches 759; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MGSASEQRVTLTNADKVLYPATGTTKSDIFDYYAGVAEVMLGHIAGRPATRKRWPNGVDQ 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MGSASEQRVTLTNADKVLYPATGTTKSDIFDYYAGVAEVMLGHIAGRPATRKRWPNGVDQ 6 0 

Qy 61 PAFFEKQLALSAPPWLSRATVAHRSGTTTYPIIDSATGLAWIAQQAALEVHVPQWRFVAE 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 PAFFEKQLALSAPPWLSRATVAHRSGTTTYPIIDSATGLAWIAQQAALEVHVPQWRFVAE 12 0 



Qy 121 PGSGELNPGPATRLVFDLDPGEGVMMAQLAEVARAVRDLLADIGLVTFPVTSGSKGLHLY 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 PGSGELNPGPATRLVFDLDPGEGVMMAQLAEVARAVRDLLADIGLVTFPVTSGSKGLHLY 180 



181 TPLDEPVSS RGATVLAKRVAQRLEQAMPALVT S TMTKS LRAGKVF VDWS QN SGSKTTIAP 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 TPLDEPVSSRGATVLAKRVAQRLEQAMPALVTSTMTKSLRAGKVFVDWSQNSGSKTTIAP 2 40 

2 41 YSLRGRTHPTVAAPRTWAELDDPALRQLSYDEVLTRIARDGDLLERLDADAPVADRLTRY 3 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 41 YSLRGRTHPTVAAPRTWAELDDPALRQLSYDEVLTRIARDGDLLERLDADAPVADRLTRY 3 0 0 

3 01 RRMRDASKTPEPIPTAKPVTGDGNTFVIQEHHARRPHYDFRLECDGVLVSWAVPKNLPDN 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3 01 RRMRDASKTPEPIPTAKPVTGDGNTFVIQEHHARRPHYDFRLECDGVLVSWAVPKNLPDN 36 0 

361 TSVNHLAIHTEDHPLEYATFEGAIPSGEYGAGKVI IWDSGTYDTEKFHDDPHTGEVIVNL 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 TSVNHLAIHTEDHPLEYATFEGAIPSGEYGAGKVI IWDSGTYDTEKFHDDPHTGEVIVNL 42 0 

421 HGGRISGRYALIRTNGDRWLAHRLKNQKDQKVFEFDNLAPMLATHGTVAGLKASQWAFEG 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 HGGRISGRYALIRTNGDRWLAHRLKNQKDQKVFEFDNLAPMLATHGTVAGLKASQWAFEG 48 0 

4 81 KWDGYRLLVEADHGAVRLRSRSGRDVTAEYPQLRALAEDLADHHWLDGEAWLDS SGVP 5 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 KWDGYRLLVEADHGAVRLRSRSGRDVTAEYPQLRALAEDLADHHWLDGEAWLDS SGVP 5 4 0 

541 SFSQMQNRGRDTRVEFWAFDLLYLDGRALLGTRYQDRRKLLETLANATSLTVPELLPGDG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 SFSQMQNRGRDTRVEFWAFDLLYLDGRALLGTRYQDRRKLLETLANATSLTVPELLPGDG 600 

6 01 AQAFACSRKHGWEGVIAKRRDSRYQPGRRCASWVKDKHWNTQEWIGGWRAGEGGRSSGV 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AQAFACSRKHGWEGVIAKRRDSRYQPGRRCASWVKDKHWNTQEWIGGWRAGEGGRSSGV 66 0 

661 GSLLMGIPGPGGLQFAGRVGTGLSERELANLKEMLAPLHTDESPFDVPLPARDAKGITYV 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 GSLLMGIPGPGGLQFAGRVGTGLSERELANLKEMLAPLHTDESPFDVPLPARDAKGITYV 72 0 

721 KPALVAEVRYSEWTPEGRLRQSSWRGLRPDKKPSEWRE 759 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 KPALVAEVRYSEWTPEGRLRQSSWRGLRPDKKPSEWRE 759 



RESULT 1 
B70585 

hypothetical protein Rv0938 - Mycobacterium tuberculosis (strain H37RV) 
C; Species: Mycobacterium tuberculosis 

C;Date: 17-Jul-1998 #sequence_revision 17-Jul-1998 #text_change 09-Jul-2004 
C;Accession: B70585 

R;Cole, S.T.; Brosch, R.; Parkhill, J.; Gamier, T . ; Churcher, C.; Harris, D.; Gordon, 
S.V.; Eiglmeier, K.; Gas, S . ; Barry III, C.E.; Tekaia, F . ; Badcock, K.; Basham, D . ; 
Brown, D . ; Chillingworth, T . ; Connor, R.; Davies, R.; Devlin, K.; Feltwell, T . ; Gentles, 
S.; Hamlin, N . ; Holroyd, S . ; Hornsby, T.; Jagels, K.; Krogh, A.; McLean, J.; Moule, S . ; 
Murphy, L . ; Oliver, S . ; Osborne, J.; Quail, M.A. ; Rajandream, M.A. ; Rogers, J.; Rutter, 
S.; Seeger, K.; Skelton, S . ; Squares, S. 



Nature 393, 537-544, 1998 

A;Authors: Sqares, R.; Sulston, J.E.; Taylor, K.; Whitehead, S . ; Barrell, B.G. 

A; Title: Deciphering the biology of Mycobacterium tuberculosis from the complete genome 

sequence . 

A;Reference number: A70500; MUID: 98295987; PMID:9634230 
A; Accession : B70585 

A; Status: preliminary; nucleic acid sequence not shown; translation not shown 
A; Molecule type: DNA 
A;Residues: 1-759 

A;Cross-references : UNIPROT : P71571 ; UNIPARC:UPI0000139E3C; GB:Z95209; GB : AL123 456 ; 

NID:g3261750; PIDN : CABO 8 492 . 1 ; PID : el299776 ; PID:g3261755 

A; Experimental source: strain H37Rv 

C;Genetics: 

A;Gene: Rv0938 

Query Match 100.0%; Score 3993; DB 2; Length 759; 

Best Local Similarity 100.0%; 

Matches 759; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MGSASEQRVTLTNADKVLYPATGTTKSDIFDYYAGVAEVMLGHIAGRPATRKRWPNGVDQ 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MGSASEQRVTLTNADKVLYPATGTTKSDIFDYYAGVAEVMLGHIAGRPATRKRWPNGVDQ 6 0 

Qy 61 PAFFEKQLALSAPPWLSRATVAHRSGTTTYPIIDSATGLAWIAQQAALEVHVPQWRFVAE 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 PAFFEKQLALSAPPWLSRATVAHRSGTTTYPIIDSATGLAWIAQQAALEVHVPQWRFVAE 12 0 

Qy 121 PGSGELNPGPATRLVFDLDPGEGVMMAQLAEVARAVRDLLADIGLVTFPVTSGSKGLHLY 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 PGSGELNPGPATRLVFDLDPGEGVMMAQLAEVARAVRDLLADIGLVTFPVTSGSKGLHLY 180 

Qy 181 TPLDEPVSSRGATVLAKRVAQRLEQAMPALVTSTMTKSLRAGKVFVDWSQNSGSKTTIAP 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TP L DEPVS SRGATVLAKRVAQRLEQAMPALVT S TMTKS LRAGKVF VDWS QN S G S KT T I AP 240 

Qy 2 41 YSLRGRTHPTVAAPRTWAELDDPALRQLSYDEVLTRIARDGDLLERLDADAPVADRLTRY 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 41 YSLRGRTHPTVAAPRTWAELDDPALRQLSYDEVLTRIARDGDLLERLDADAPVADRLTRY 300 

Qy 301 RRMRDASKTPEPIPTAKPVTGDGNTFVIQEHHARRPHYDFRLECDGVLVSWAVPKNLPDN 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 RRMRDASKTPEPIPTAKPVTGDGNTFVIQEHHARRPHYDFRLECDGVLVSWAVPKNLPDN 360 

Qy 361 TSVNHLAIHTEDHPLEYATFEGAIPSGEYGAGKVI IWDSGTYDTEKFHDDPHTGEVIVNL 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TSVNHLAIHTEDHPLEYATFEGAIPSGEYGAGKVI IWDSGTYDTEKFHDDPHTGEVIVNL 420 

Qy 421 HGGRISGRYALIRTNGDRWLAHRLKNQKDQKVFEFDNLAPMLATHGTVAGLKASQWAFEG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 HGGRISGRYALIRTNGDRWLAHRLKNQKDQKVFEFDNLAPMLATHGTVAGLKASQWAFEG 480 

Qy 481 KWDGYRLLVEADHGAVRLRSRSGRDVTAEYPQLRALAEDLADHHWLDGEAWLDSSGVP 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 KWDG YRL L VEADHGAVRLRSRSGRDVTAE YPQLRALAEDLADHHWL DGE AWL D S S GVP 540 

Qy 541 SFSQMQNRGRDTRVEFWAFDLLYLDGRALLGTRYQDRRKLLETLANATSLTVPELLPGDG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



541 SFSQMQNRGRDTRVEFWAFDLLYLDGRALLGTRYQDRRKLLETLANATSLTVPELLPGDG 600 



6 01 AQAFACSRKHGWEGVIAKRRDSRYQPGRRCASWVKDKHWNTQEWIGGWRAGEGGRSSGV 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AQAFACSRKHGWEGVIAKRRDSRYQPGRRCASWVKDKHWNTQEWIGGWRAGEGGRSSGV 66 0 

661 GSLLMGIPGPGGLQFAGRVGTGLSERELANLKEMLAPLHTDESPFDVPLPARDAKGITYV 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 GSLLMGIPGPGGLQFAGRVGTGLSERELANLKEMLAPLHTDESPFDVPLPARDAKGITYV 72 0 

721 KPALVAEVRYSEWTPEGRLRQSSWRGLRPDKKPSEWRE 759 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 KP AL VAE VRY S E WTPEGRLRQS S WRGLRPDKKP S EWRE 759 



